AWS公式トレーニング「Big Data on AWS」受講レポート

2017.02.22

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

2016年12月19日〜21日の日程で、AWSの公式トレーニング「Big Data on AWS」を受講してきました。 AWSのデータ分析で利用できるサービスが網羅的に紹介され、またそれらを組み合わせたデータ分析の実践がハンズオンで学べる、これからAWSでデータ分析を始めたい方に最適なトレーニングとなっていました。

以下トレーニングの詳しい内容についてお伝えしていきます。

トレーニングの概要

「Big Data on AWS」では、AWSクラウドプラットフォームでのビッグデータソリューションについて紹介します。このコースではAmazon Elastic MapReduce（Amazon EMR）、およびHiveやHueといったHadoopツールの広範なエコシステムを使ってデータを処理する方法について説明します。また、ビッグデータ環境を作成する方法、Amazon DynamoDB、Amazon Redshift、およびAmazon Kinesisとの連携方法、セキュリティやコストの効率化のためのベストプラクティスを活用する方法についても説明します。

AWS トレーニング | Big Data on AWS

トレーニングは3日間あり、内容は大まかに以下の構成になっています。

ビッグデータの概要

ビッグデータの定義、ビッグデータ処理のパイプラインとツール
データ転送、取り込みのベストプラクティス、など

ビッグデータのストレージソリューション

Amazon Simple Storage Service（S3）（以後Amazon S3）
Amazon Relational Database Service（RDS）（以後、Amazon RDS）
Amazon DynamoDB
Amazon Elastic MapReduce（EMR）（以後Amazon EMR）
Amazon Elasticsearch Service
それぞれのソリューションの特徴とユースケースについて

ストリーミングデータとAmazon Kinesis

ストリーミングデータの概念
Amazon Kinesisの特徴とユースケースなど

Amazon EMR

Apach HadoopとAmazon EMRの概論、Amazon EMRのアーキテクチャ
Hadoopプログラミングフレームワーク（Hive、Presto、Pig、Spark）、Amazon EMRのコストやセキュリティ、など

Amazon Redshift

DWHとデータベースの比較、DWH設計のアプローチ、列志向データストアの特徴
Amazon Redshiftの概論、アーキテクチャ、環境の最適化（分散キー、データ圧縮など）、セキュリティ、など

ビッグデータの可視化

代表的なサードベンダー製の可視化ツール
Amazon QuickSight、など

カリキュラムの詳細はAWS トレーニング | Big Data on AWSの「コースの概要」をご覧ください。

対象者

このコースは次のような方を対象としています。

データの保存先としてAWSを利用し、AWS上での大規模なデータ処理のために、Amazon EMRやAmazon Kinesisなど様々なAWSサービスをビッグデータパイプラインの構築に活用する方

Amazon Elastic Compute Cloud (EC2) （以後Amazon EC2）やAmazon RDSなどAWSのベーシックなサービスはすでに利用していてこれからデータ分析もAWSでやっていきたいという方向け、AWSのトレーニング群の中では中級者向けのトレーニングになるかと思います。またオンプレミス環境でApache Hadoopなどを使ったデータ分析の経験があり、Amazon EMRやAmazon RedshiftなどAWSでのデータ分析ソリューションについて学びたい方にもフィットするトレーニングという印象を持ちました。

前提知識

このトレーニングでは、受講する前に次の知識を身につけておくことが推奨されています。

Apache HadoopおよびHadoop Distributed File System（HDFS）を含むビッグデータ技術に対する基本的な知識
WebベーストレーニングのBig Data Technology Fundamentalsの修了または同等の経験
コアAWSサービスおよびパブリッククラウド導入についての実務的知識
AWS Techinical Essentials 1、AWS実践入門1、コースの修了または同等の経験
データウェアハウス、リレーショナルデータベースシステム、およびデータベースの設計についての基本的な知識

AWSに関する基礎知識がある上で、一般的なリレーショナルデータベース（RDBMS）を操作した経験のある方であれば条件を満たしていると思います。 Apache Hadoopについてはトレーニングの中で概論から学べますので、利用経験がなくとも特に問題ないかと思います。

講習実施風景

注：会場、講師やスケジュール配分は、開催日程によって異なる可能性があります。

今回トレーニングの会場となったのは東京、目黒にあるAWSJのオフィスでした。各席には演習を実施する為のノートPCと追加ディスプレイが設置されています。ノートPCは持ち込みも可能となっていました。

講師はアマゾンウェブサービスジャパンテクニカルトレーナーの鬼形さん、同ソリューションアーキテクトの半場さんの2名体制でした。

（テクニカルトレーナー鬼形さん）

（ソリューションアーキテクト半場さん）